Lernerfolgsfragen

Sitzung 1 bis 12

LEF 1

Offene Aufgaben

Beantwortet so kurz wie möglich und nur so ausführlich wie nötig die folgenden offenen Fragen.

Frage 1.1

In welchen Zusammenhang des Forschungsprozesses gehört die Datenanalyse?

Frage 1.2

Forschungsprozess

Frage 1.2

Welcher Schritt muss zwischen Datenerfassung und Datenanalyse noch eingeschoben werden? Tipp: Geht mit Daten… los.

Frage 1.3

Was ist mit «Schliessender Statistik» gemeint? Wie wird sie noch bezeichnet und was braucht es für die schliessende Statistik? Tipp: Schauen Sie in die Vokabeln.

Frage 1.4

Was fällt alles unter «Datenvisualisierung»? Tipp: Schauen Sie ins Glossar.

Frage 1.5

Wie lautet der Fachterminus für «Durchschnitt»? Wie lautet der englische Fachbegriff?

Frage 1.6

Wie schreibt man die Funktion in R, um einen Durchschnitt zu berechnen? Tipp: Dasselbe wie bei der vorherigen Frage.

Ausführlich hier im Skript.

Frage 1.7

Haben Sie schon die Befragung (www.soscisurvey.de/statistik) gemacht? Wie viele STP bekommen Majorstudierende dafür?

10 STP. Am Ende dieses Semesters solltet ihr insgesamt 80 STP haben. Vergleicht dazu das FAQ auf der Begleiterin.

Frage 1.8

Welche Note bräuchten Sie in den von Ihnen gebuchten Modulen mindestens, wenn Sie am Ende des Semesters mindestens eine 5.0 haben wollen? Tipp: Nutzen Sie die Vorlage hier in R-Studio.

Gewichtete_Summe <- 4.5 * 3 + # Medienpolitik (3 ECTS)
5.0 * 3 * 3 + # EKMF, Medeninhalte, Meth: Einf. (je 3 ECTS)
5.0 * 6 + # Basistheorien (6 ECTS)
5.5 * 9 + # Statistik: Einf. (9 ECTS)
6.0 * 3 # Wiss. Arbeiten (3 ECTS)

n <- 5 * 3 + 6 + 9

Gewichtete_Summe / n
[1] 5.2

Frage 1.9

Wozu kann man hypothes.is verwenden? Tipp: Die Leiste auf der rechten Seite der Begleiterin-Website.

Geschlossene Aufgaben

  • Kprim (MC)
  • Single-Choice (SC)
  • Tutorat (TRT)

MC 1.1

Sind folgende Aussagen richtig oder falsch?

Es gibt eine PDF-Version der Begleiterin-Website

Mit der PDF-Version der Begleiterin lässt sich besser arbeiten

Mit hypothis am rechten Rand, kann man für sich, in Lerngruppen oder public die Website markieren und kommentieren

Die Lernerfolgsfragen LEF sind die Basis für die Klausur.

SC 1.1

Mit welchen Materialien bereitet man sich am besten auf die Klausur vor?

mit Vorlesung, Tutorat, Forum sowie Begleiterin und LEF

mit den Folien, Vorlesungsaufzeichnungen

mit den Statistikunterlagen aus Psychologie

chat-gpt und deepseek

LEF

MC 1.2

Sind folgende Aussagen richtig oder falsch?

Die Formelsammlung kann in der Klausur verwendet werden.

Die Vokabeln des Glossars/Vokabelliste müssen Sie beherrschen.

In den FAQ steht nichts, was für Sie interessant oder relevant sein könnte.

Ihre Dozierenden und Tutor:innen sind kein bisschen genervt, wenn FAQ nochmal in einer persönliche Mail gefragt werden.

MC 1.3

Sind folgende Aussagen richtig oder falsch?

Am Ende dieses Semesters sollten Majorstudierende mindestens 80STP haben!

Minor-Studierende und Studierende mit Statistik als Auflage müssen auch die STP machen.

Wer später in den Major KW gewechselt ist, muss weniger Punkte machen, aber Bescheid geben.

Auch ohne die STP zu erledigen, kommt man irgendwie durch.

MC 1.4

Sind folgende Aussagen richtig oder falsch?

Nach der Datenerfassung müssen die Daten vor der Analyse noch aufbereitet werden.

Für die Klausur müssen viele Formeln auswendig gelernt werden.

Wer im Matura keine Statistik hatte, muss das alles noch nachholen.

Die Mathematik für Statistik ist recht simpel, aber das nichtmathematische ist schwer.

MC 1.5

Sind folgende Aussagen richtig oder falsch?

Der Weg vom Nichtwissen zum Wissen heisst Lernen und ist mit viel Frust verbunden.

Lernfrust ist der Schmerz, den man durchstehen muss im geistigen Training.

Statistik wird kumulativ vermittelt. Wer nicht mitlernt, wird abgehängt.

Für Statistik muss man Talent haben, das man nicht erlernen kann.

TRT 1.1

Wenn Sie in EKMF eine 5.0 (3 ECTS) haben und in «Methoden Einführung» (3 ECTS) eine 6.0, was haben Sie dann in den beiden Modulen im Durchschnitt?

Gewichtete_Summe <- 5.0 * 3 + # EKMF Note mit 3 ECTS
  6.0 * 3 # Methoden Einführung Note mit 3 ECTS

TRT 1.1

Wenn Sie in EKMF eine 5.0 (3 ECTS) haben und in «Methoden Einführung» (3 ECTS) eine 6.0, was haben Sie dann in den beiden Modulen im Durchschnitt?

Gewichtete_Summe <- 5.0 * 3 + 
  6.0 * 3 

n <- 2 * 3 # oder: 3 + 3; Zahl durch die geteilt wird

TRT 1.1

Wenn Sie in EKMF eine 5.0 (3 ECTS) haben und in «Methoden Einführung» (3 ECTS) eine 6.0, was haben Sie dann in den beiden Modulen im Durchschnitt?

Gewichtete_Summe <- 5.0 * 3 + 
  6.0 * 3 

n <- 2 * 3

Gewichtete_Summe / n 
[1] 5.5

TRT 1.2

Durch welche Zahl müssen Sie die gewichtete Summe Ihrer Noten teilen, um Ihre Durchschnittsnote zu berechnen, wenn Sie in «EKMF» (3 ECTS) eine 5.5 haben, in «Methoden Einführung» (3 ECTS) eine 6.0 und in «Basistheorien» (6 ECTS) eine 5.5 haben.

Gewichtete_Summe <- 5.5 * 3 + # EKMF Note mit 3 ECTS
  6.0 * 3 + # Methoden Einführung Note mit 3 ECTS
  5.5 * 6 # Basistheorien Note mit 6 ECTS

TRT 1.2

Durch welche Zahl müssen Sie die gewichtete Summe Ihrer Noten teilen, um Ihre Durchschnittsnote zu berechnen, wenn Sie in «EKMF» (3 ECTS) eine 5.5 haben, in «Methoden Einführung» (3 ECTS) eine 6.0 und in «Basistheorien» (6 ECTS) eine 5.5 haben.

Gewichtete_Summe <- 5.5 * 3 + 
  6.0 * 3 + 
  5.5 * 6 

n <- (2 * 3) + (1 * 6) # oder: 3 + 3 + 6; Zahl durch die geteilt wird

TRT 1.2

Durch welche Zahl müssen Sie die gewichtete Summe Ihrer Noten teilen, um Ihre Durchschnittsnote zu berechnen, wenn Sie in «EKMF» (3 ECTS) eine 5.5 haben, in «Methoden Einführung» (3 ECTS) eine 6.0 und in «Basistheorien» (6 ECTS) eine 5.5 haben.

Gewichtete_Summe <- 5.5 * 3 + 
  6.0 * 3 + 
  5.5 * 6 

n <- (2 * 3) + (1 * 6) 
n
[1] 12

LEF 2

Offene Aufgaben

Beantwortet so kurz wie möglich und nur so ausführlich wie nötig die folgenden offenen Fragen.

Frage 2.1

Zählen Sie drei Grundformen der Datenvisualisierung auf? Tipp: Nicht Diagrammarten.

Frage 2.2

Was ist der Unterschied zwischen einem Säulendiagramm und einem Balkendiagramm. Wie werden beide im Englischen genannt?

Frage 2.3

Was ist der Unterschied zwischen einem Donut- und einem Kreis- bzw. Tortendiagramm?

Frage 2.4

Würden Sie Kennwerte auch zu den Datenvisualisierungen zählen? Begründen Sie Ihre Antwort.

Frage 2.8

Was ist:

\[ \sum_{i=1}^{5} i \]

Frage 2.9

Berechnen Sie:

\[ \sum_{i=1}^{10} 4 = ? \]

Frage 2.10

Berechnen Sie:

\[ \sum_{i=1}^{5} (3i + 1) = ? \]

Mit zwei Zeilen Code sieht das so aus.

i <- c(1:5)
sum(3 * i + 1)
[1] 50

Frage 2.10

Berechnen Sie:

Man kann es aber auch «von Hand» machen:

3 * 1 + 1 # 1 eingesetzt
[1] 4
3 * 2 + 1 # 2 eingesetzt
[1] 7
3 * 3 + 1 # 3 eingesetzt
[1] 10
3 * 4 + 1 # 4 eingesetzt
[1] 13
3 * 5 + 1 # 5 eingesetzt
[1] 16
4 + 7 + 10 + 13 + 16  # Summe aus allen Berechnungen bilden
[1] 50

Frage 2.11

Berechnen Sie:

Wenn \(a_{i}\) = \(i\) und \(n\) = \(7\), \(k\) = \(2\) \[ \sum_{i=1}^{7} a_i = \sum_{i=1}^{2} a_{i} + \sum_{i=3}^{7} a_{i} = ? \]

Frage 2.12

Zeigen Sie, dass das stimmt:

\[ \sum_{i=1}^{n} (a_i - b)^2 = \sum_{i=1}^{n} a_{i}^{2} - 2b \sum_{i=1}^{n} a_{i} + nb^2 \]

Tipp: Googeln Sie nach binomischer Formel.

Frage 2.13

Mit welchem Befehl werden in R…

  • Zeilen
  • Spalten

…ausgewählt?

Frage 2.14

Wie sieht in R der typische Zuweisungsoperator aus?

Frage 2.15

Mit welchem R-Befehl können Sie einen Datensatz sortieren?

Frage 2.16

Mit welchem R-Befehl können Sie neue Variablen berechnen?

Geschlossene Aufgaben

  • Kprim (MC)
  • Single-Choice (SC)
  • Text Replacement Task (TRT)

MC 2.1

Sind folgende Aussagen richtig oder falsch?

Balkendiagramme sind eigentlich horizontal angeordnet, aber oft werden auch Säulendiagramme als «Balkendiagramme» bezeichnet.

Für Zeitverläufe eignen sich eher Donutdiagramm als Liniendiagramm.

Tabellen gehören nicht zu den Datenvisualisierungen..

Kennwerte gehören nicht zu den Datenvisualisierungen.

SC 2.1

Mit welchem Diagrammtyp lassen sich am besten Umfänge von Ausprägungen vergleichen, die lange Namen haben?

Tortendiagramm

Donutdiagramm

Säulendiagramm

Balkendiagramm

Textwolke

MC 2.2

Sind folgende Aussagen richtig oder falsch?

Die «Grammar of Graphics» ist ein System, um den Aufbau von graphischen Datenvisualisierungen zu beschreiben.

Donutdiagramme können ineinander verschachtelt werden.

Zu den wichtigsten Elementen nach der «Grammar of Graphics» gehören: Konstanten, Charts und Balkendiagramme.

Das Graphikpaket ggplot2 ist nach den Regeln des «Grammar of Graphics» aufgebaut.

MC 2.3

Befragung

MC 2.3

Sind folgende Aussagen richtig oder falsch?

38 Prozent der Befragten sagen, dass die Aussage auf sie voll und ganz zutrifft.

38 Prozent der Befragten streben eine gute Note voll und ganz an.

13 Prozent der Befragten ist eine gute Note nicht so wichtig.

Alle Befragten haben auf die Frage geantwortet.

MC 2.4

Sind folgende Aussagen richtig oder falsch?

Die Reihenfolge der Summanden einer Summe ist egal.

Beim Rechnen mit Summenzeichen ist die Reihenfolge der Werte nicht egal.

Die Summe eines Summenzeichens kann man zerlegen.

Die Summe einer Konstante ist das Quadrat der Konstanten.

MC 2.5

Sind folgende Aussagen für R richtig oder falsch?

Der übliche Zuweisungsoperator in R ist: <-

Der übliche Zuweisungsoperator in R ist: <|

Mit einer Pipe werden zeilenweise Grafiken weiterverarbeitet.

Der Pipe-Operator in R ist |>, aber es geht auch %>%.

MC 2.6

Sind folgende Aussagen für R richtig oder falsch?

Mit «filter» werden Variablen bzw. Spalten ausgewählt.

Mit «select» werden Variablen bzw. Spalten ausgewählt.

Mit «c» werden Werte zu einem Vektor kombiniert.

Mit «mutate» werden neue Variablen berechnet.

TRT 2.1

Setzen Sie den richtigen Befehl ein (Tipp: select, filter, count oder mutate)

DATEN <- DATEN |> 
  ____(eins = 1)

TRT 2.1

Setzen Sie den richtigen Befehl ein (Tipp: select, filter, count oder mutate)

DATEN <- DATEN |> 
  mutate(eins = 1)

TRT 2.3

Setzen Sie den richtigen Befehl ein (Tipp: select, filter, count oder mutate)

DATEN <- DATEN |> 
  ____(!is.na(eins))

TRT 2.3

Setzen Sie den richtigen Befehl ein (Tipp: select, filter, count oder mutate)

DATEN <- DATEN |> 
  filter(!is.na(eins))

TRT 2.4

Setzen Sie den richtigen Befehl ein (Tipp: select, filter, count oder mutate)

DATEN <- DATEN |> 
  ____("eins")

TRT 2.4

Setzen Sie den richtigen Befehl ein (Tipp: select, filter, count oder mutate)

DATEN <- DATEN |> 
  select("eins")

LEF 3

Offene Aufgaben

Beantwortet so kurz wie möglich und nur so ausführlich wie nötig die folgenden offenen Fragen.

Frage 3.1

Nennen Sie drei Lagemasse und ordnen Ihnen jeweils das benötigte Skalenniveau zu.

Frage 3.2

In welchen Fällen ist der Median a) besser als der Mittelwert? Und b) warum?

Frage 3.3

In welche beiden Unterkategorien werden die nominalen Skalenniveaus unterschieden?

Frage 3.4

Was ist das Problem, wenn man einen Mittelwert von einer kategorialen Variablen berechnet? Warum ist das bei einer Dummyvariable kein Problem?

Frage 3.5

Bestimmen beziehungsweise berechnen Sie für folgende Häufigkeitsauszählung a) Modalwert, b) Median, c) Mittelwert.

Häufigkeitsauszählung

Frage 3.6

Schauen Sie sich die folgende Häufigkeitsauszählung an und bestimmen Sie a) den am häufigsten vorkommenden Wert, b) den Durchschnitt.

Häufigkeitsauszählung

Frage 3.7

Für die folgende Häufigkeitstabelle sollen a) Modus, b) 50%-Perzentil und c) der Average berechnet werden.

Häufigkeitsauszählung

Geschlossene Aufgaben

  • Kprim (MC)
  • Single-Choice (SC)
  • Text Replacement Task (TRT)

MC 3.1

Sind folgende Aussagen richtig oder falsch?

Kenntnis von R-Studio

MC 3.1

Sind folgende Aussagen richtig oder falsch?

Der Mittelwert der Variablen muss 0.25 sein.

Der Modalwert ist «nicht gewählt».

Der Median dieser Variable ist 0.74

Diese Frage haben alle 221 Befragten beantwortet.

TRT 3.2

Setzen Sie den richtigen Befehl ein, um eine Dummy zu berechnen.

DATEN <- DATEN |> 
  ____(Dummy = if_else(E201_02 > 3, 1, 0))

TRT 3.2

Setzen Sie den richtigen Befehl ein, um eine Dummy zu berechnen.

DATEN <- DATEN |> 
  mutate(Dummy = if_else(E201_02 > 3, 1, 0))

SC 3.3

Welches der folgenden Lagemasse liefert die beste Information bei ordinalem Skalenniveau?

Mittelwert

Modalwert

Median

Modus

Mean

MC 3.4

Sind folgende Aussagen richtig oder falsch?

Der Mittelwert einer Dummyvariablen entspricht dem Anteil der 1-Werte.

Der Mittelwert einer Dummyvariablen ist immer 1.

Der Median ist immer grösser als der Mittelwert.

Bei einer bimodalen Verteilung gibt es zwei Mittelwerte.

MC 3.5

Sind folgende Aussagen richtig oder falsch?

Jede Verteilung hat mindestens einen Modus.

Anhand einer Häufigkeitstabelle lässt sich der Median nicht bestimmen.

Mit Hilfe einer Häufigkeitstabelle kann man den Mittelwert ausrechnen.

Der Median ist robust gegenüber Ausreissern.

MC 3.6

Sind folgende Aussagen richtig oder falsch?

Quarto basiert auf Word.

Eine .qmd-Datei kann man mit jedem Editor öffnen und lesen.

In Quarto liegt ein Projekt in einem Ordner.

Quarto-Projekte können mit RStudio oder Positron bearbeitet werden.

TRT 3.7

Setzen Sie den richtigen Befehl ein (Tipp: select, filter, count oder mutate)

DATEN <- DATEN |> 
  ____(eins = 1)

TRT 3.7

Setzen Sie den richtigen Befehl ein (Tipp: select, filter, count oder mutate)

DATEN <- DATEN |> 
  mutate(eins = 1)

TRT 3.8

Setzen Sie den richtigen Befehl ein (Tipp: select, filter, count oder mutate)

DATEN <- DATEN |> 
  ____(!is.na(eins))

TRT 3.8

Setzen Sie den richtigen Befehl ein (Tipp: select, filter, count oder mutate)

DATEN <- DATEN |> 
  filter(!is.na(eins))

TRT 3.9

Setzen Sie den richtigen Befehl ein (Tipp: select, filter, count oder mutate)

DATEN <- DATEN |> 
  ____("eins")

TRT 3.9

Setzen Sie den richtigen Befehl ein (Tipp: select, filter, count oder mutate)

DATEN <- DATEN |> 
  select("eins")

LEF 4

Offene Aufgaben

Beantwortet so kurz wie möglich und nur so ausführlich wie nötig die folgenden offenen Fragen.

Frage 4.1

Warum ist die Betrachtung von Streuung wichtig?

Frage 4.2

Warum kann ein geringer Mittelwert mit hoher Streuung auftreten?

Frage 4.3

Wann wäre der Interquartilsabstand nützlicher als die Standardabweichung?

Frage 4.5

Zählen Sie genau drei Streuungsmasse auf (drei Richtige und zwei Falsche geben einen Punkt!).

Frage 4.6

Wie ist Varianz für die Stichprobe definiert? (Tipp: Formelsammlung)

Frage 4.7

Was ist gemeint, wenn es heisst, dass die Standardabweichung, im Unterschied zur Varianz, formal dieselbe Skalierung wie die Variable hat?

Frage 4.8

Wie ist der Variationskoeffizient (VK) definiert?

Geschlossene Aufgaben

  • Kprim (MC)
  • Single-Choice (SC)
  • Text Replacement Task (TRT)

MC 4.1

Sind folgende Aussagen richtig oder falsch?

Streuungsmasse sind Masse der zentralen Tendenz

Es gibt verschiedene Streuungsmasse für verschiedene Skalenniveaus.

Streuungsmasse sind immer grösser als Lagemasse.

Das wichtigste Streumass ist der IQR.

SC 4.2

Welches der folgenden Streumasse ist das beste um die Streuung in einer metrischen Variablen zu beschreiben?

IQR

MAD

Range

Varianz

Standardabweichung

MC 4.3

Sind folgende Aussagen richtig oder falsch?

Die Varianz einer Variablen ist immer grösser als ihre Standardabweichung (SD).

Die Standardabweichung einer Variablen ist immer grösser als ihr Mittelwert.

Die Varianz ist immer grösser als oder gleich dem MAD.

Bei Dummyvariablen ist die Varianz immer kleiner oder gleich der SD. (schwer)

SC 4.4

Welche der folgenden Aussagen über die Varianz ist korrekt?

Sie ist immer kleiner als die Standardabweichung.

Sie hat dieselbe Einheit wie die ursprünglichen Daten.

Sie ist immer positiv.

Sie wird durch den Median berechnet.

Extremwerte werden nicht berücksichtigt.

MC 4.4

Sind folgende Aussagen richtig oder falsch?

Die Spannweite ist dasselbe wie der Range einer Variablen.

In R wird mit der Funktion range() das Maximum und das Minimum einer Variable rausgegeben.

Der Interquartilsabstand ist robust gegenüber Ausreissern.

Robust nennt man einen Kennwert, wenn er nicht vom Mittelwert beeinflusst wird.

MC 4.6

Sind folgende Aussagen richtig oder falsch?

Der MAD ist der verrückteste Kennwert der bivariaten Statistik.

Der MAD ist unempfindlicher gegenüber Extremwerten als die SD.

Der MAD wird in den Einheiten der Ursprungsvariable angegeben.

Der MAD ist ein standardisiertes Mass.

MC 4.7

Sind folgende Aussagen richtig oder falsch?

\[ s^2 = \frac{1}{n} \sum(X_i - \bar{X})^2 \]

Die Formel gibt die Varianz für die GG wieder.

Die Schätzung der Varianz für die GG ist immer grösser als die für die Stichprobe.

Der Unterschied zwischen der Varianz der Stichprobe und GG wird mit steigendem n immer kleiner.

Würde man die Mittelwertdifferenzen nicht quadrieren, wäre die Summe immer 0.

TRT 4.8

Fügen Sie die Funktion ein, mit der der Mittelwert berechnet wird.

DATEN |> 
  summarise(Mittel = _____ (E201_19, na.rm = TRUE))

TRT 4.8

Fügen Sie die Funktion ein, mit der der Mittelwert berechnet wird.

DATEN |> 
  summarise(Mittel = mean(E201_19, na.rm = TRUE))

TRT 4.9

Fügen Sie die Funktion ein, mit der Standardabweichung berechnet wird.

DATEN |> 
  summarise(Standardabweichung = _____ (E201_19, na.rm = TRUE))

TRT 4.9

Fügen Sie die Funktion ein, mit der Standardabweichung berechnet wird.

DATEN |> 
  summarise(Standardabweichung = sd(E201_19, na.rm = TRUE))

TRT 4.10

Setzen Sie die gesuchte Funktion so ein, dass Sie in einer neuen Variable immer dann eine 0 haben, wenn Jemand vor 2003 geboren ist und eine 1, wenn 2003 oder später.

DATEN <- DATEN |> 
  mutate(Alter = as.numeric(SD04_01)) |>
  mutate(Jung = ______ (Alter <= 2003, 0, 1))

TRT 4.10

Setzen Sie die gesuchte Funktion so ein, dass Sie in einer neuen Variable immer dann eine 0 haben, wenn Jemand vor 2003 geboren ist und eine 1, wenn 2003 oder später.

DATEN <- DATEN |> 
  mutate(Alter = as.numeric(SD04_01)) |>
  mutate(Jung = if_else(Alter <= 2003, 0, 1))

LEF 5

Offene Aufgaben

Beantwortet so kurz wie möglich und nur so ausführlich wie nötig die folgenden offenen Fragen.

Frage 5.1

Was bedeutet es, wenn es heisst, dass die Standardabweichung und der Mittelwert einer Variablen «skalenabhängig» sind?

Frage 5.2

Erklären Sie, was eine z-Transformation ist und warum sie in der Statistik verwendet wird.

Frage 5.3

In einem anderen Semester wurden Studierende nach ihrer Mediennutzungsdauer (in Minuten pro Tag) gefragt. Das Ergebnis: Mittelwert = 180, Standardabweichung = 30. Alex nutzt täglich 240 Minuten Medien. Berechnen Sie den z-Wert für Alex.

Frage 5.4

Warum bedeutet eine hohe Korrelation zwischen zwei Variablen nicht automatisch, dass eine kausale Beziehung besteht? Geben Sie ein Beispiel aus der Medienforschung.

Frage 5.5

Sie berechnen eine Pearson-Korrelation von 𝑟 = −0.25 zwischen der Nutzungsdauer sozialer Medien und der Schlafqualität. Wie interpretieren Sie dieses Ergebnis inhaltlich?

Frage 5.6

Wie nennt man im Zusammenhang mit Korrelationen eine Drittvariable, die dazu führt, dass eine bivariate Korrelation zweier Variablen grösser oder kleiner ausfällt als der tatsächliche Zusammenhang?

Frage 5.7

In einer kleinen Erhebung wurde mit drei verschiedenen Fragen unterschiedlicher Skalierung dasselbe gemessen. Vervollständigen Sie den folgenden Code und beantworten Sie die Frage, mit welcher Frageform der relativ gesehen kleinste und mit welcher der grösste Durchschnitt erreicht wird.

library(tidyverse)

DATEN <- tibble::tibble(
  dummy   = c(0, 1, 0, 0, 1, 1, 1, 1, 0, 0),
  likert5 = c(3, 3, 4, 2, 5, 5, 3, 4, 2, 3),
  likert7 = c(4, 3, 5, 7, 2, 1, 6, 5, 4, 2), 
)

DATEN |>
  mutate(dummy_s = dummy / 1) |> 
  summarise(dummy_m = mean(dummy_s, na.rm = TRUE))

Frage 5.7

In einer kleinen Erhebung wurde mit drei verschiedenen Fragen unterschiedlicher Skalierung dasselbe gemessen. Vervollständigen Sie den folgenden Code und beantworten Sie die Frage, mit welcher Frageform der relativ gesehen kleinste und mit welcher der grösste Durchschnitt erreicht wird.

library(tidyverse)

DATEN <- tibble::tibble(
  dummy   = c(0, 1, 0, 0, 1, 1, 1, 1, 0, 0),
  likert5 = c(3, 3, 4, 2, 5, 5, 3, 4, 2, 3),
  likert7 = c(4, 3, 5, 7, 2, 1, 6, 5, 4, 2), 
)

DATEN |>
  mutate(dummy_s = dummy / 1,
         likert5_s = (likert5 - 1) / 4, # Skala verschieben und stauchen
         likert7_s = (likert7 - 1) / 6) |> # Skala verschieben und stauchen
  summarise(dummy_m = mean(dummy_s),
            likert5_s = mean(likert5_s), 
            likert7_s = mean(likert7_s))

Frage 5.7

In einer kleinen Erhebung wurde mit drei verschiedenen Fragen unterschiedlicher Skalierung dasselbe gemessen. Vervollständigen Sie den folgenden Code und beantworten Sie die Frage, mit welcher Frageform der relativ gesehen kleinste und mit welcher der grösste Durchschnitt erreicht wird.

library(tidyverse)

DATEN <- tibble::tibble(
  dummy   = c(0, 1, 0, 0, 1, 1, 1, 1, 0, 0),
  likert5 = c(3, 3, 4, 2, 5, 5, 3, 4, 2, 3),
  likert7 = c(4, 3, 5, 7, 2, 1, 6, 5, 4, 2), 
)

DATEN |>
  mutate(dummy_s = dummy / 1,
         likert5_s = (likert5 - 1) / 4, # Skala verschieben und stauchen
         likert7_s = (likert7 - 1) / 6) |> # Skala verschieben und stauchen
  summarise(dummy_m = mean(dummy_s),
            likert5_s = mean(likert5_s), 
            likert7_s = mean(likert7_s))
# A tibble: 1 × 3
  dummy_m likert5_s likert7_s
    <dbl>     <dbl>     <dbl>
1     0.5       0.6     0.483

Geschlossene Aufgaben

  • Kprim (MC)
  • Single-Choice (SC)
  • Text Replacement Task (TRT)

MC 5.1

Sind folgende Aussagen richtig oder falsch?

Nach einer z-Transformation haben alle Variablen den Mittelwert 1.

Eine z-Transformation ändert nicht die Korrelation zwischen Variablen.

Zentrierung einer Variablen und z-Tranformation sind dasselbe.

Dummyvariablen können auch standardisiert werden.

MC 5.2

Sind folgende Aussagen richtig oder falsch?

Ein z-Wert von 2 bedeutet, dass eine Beobachtung genau doppelt so gross ist wie der Mittelwert.

Ein z-Wert kann niemals negativ sein.

z-Werte helfen dabei, Werte über verschiedene Skalen hinweg zu vergleichen.

Nach der z-Transformation mehrerer Variablen können deren Mittelwerte gut verglichen werden.

MC 5.3

Sind folgende Aussagen richtig oder falsch?

r setzt voraus, dass beide Variablen auf mindestens ordinalem Niveau gemessen wurden.

r setzt voraus, dass beide Variablen metrisch skaliert sind.

r kann auch für Dummyvariablen verwendet werden.

r misst lineare Zusammenhänge zwischen zwei Variablen.

MC 5.4

Sind folgende Aussagen richtig oder falsch?

Eine hohe Korrelation zwischen Fernsehzeit und Wahlbeteiligung bedeutet, dass Fernsehen zur Wahlmotivation führt.

Eine negative Korrelation bedeutet, dass beide Variablen sich tendenziell entgegengesetzt verändern.

Die Pearson-Korrelation kann Werte grösser als 1 annehmen.

Eine Korrelation von 0 bedeutet, dass kein Zusammenhang besteht.

SC 5.5

Ab welchem Skalenniveau können Korrelationen verwendet werden? Die Skalenniveaus sind nicht aufsteigend geordnet.

ordinal

kategorial

dichotom

interval

rational

TRT 5.6

Setzen Sie den richtigen Befehl ein, um die Variable standardisierte Variable E201_02_z zu erhalten (Tipp: mean, sd, corr, var, sqrt, scale, !is.na, standz, z_trans).

DATEN <- DATEN |> 
  mutate(E201_02_m = mean(E201_02, na.rm = TRUE),
         E201_02_z = (E201_02 - E201_02_m) / ____ (E201_02, na.rm = TRUE))

TRT 5.6

Setzen Sie den richtigen Befehl ein, um die Variable standardisierte Variable E201_02_z zu erhalten (Tipp: mean, sd, corr, var, sqrt, scale, !is.na, standz, z_trans).

DATEN <- DATEN |> 
  mutate(E201_02_m = mean(E201_02, na.rm = TRUE),
         E201_02_z = (E201_02 - E201_02_m) / sd(E201_02, na.rm = TRUE))

TRT 5.7

Setzen Sie den richtigen Befehl ein, um die E201_02 zu zentrieren (Tipp: Mögliche NA sollen ignoriert werden. Möglichkeiten: mean, sd, corr, var, sqrt, scale, !is.na, na.rm = TRUE, na.rm = FALSE).

DATEN <- DATEN |> 
  mutate(E201_02_z = E201_02 - __________ )

TRT 5.7

Setzen Sie den richtigen Befehl ein, um die E201_02 zu zentrieren (Tipp: Mögliche NA sollen ignoriert werden. Möglichkeiten: mean, sd, corr, var, sqrt, scale, !is.na, na.rm = TRUE, na.rm = FALSE).

DATEN <- DATEN |> 
  mutate(E201_02_z = E201_02 - mean(E201_02, na.rm = TRUE))

TRT 5.8

Setzen Sie den richtigen Befehl ein, um die pearsonsche Korrelation zwischen E201_02 und E201_08 zu erhalten (Tipp: mean, sd, var, sqrt, scale, !is.na, cor, z_trans).

 DATEN |> 
  select(E201_02, E201_08) |>
  filter(!is.na(E201_02) & !is.na(E201_08)) |>
  _____()

TRT 5.8

Setzen Sie den richtigen Befehl ein, um die pearsonsche Korrelation zwischen E201_02 und E201_08 zu erhalten (Tipp: mean, sd, var, sqrt, scale, !is.na, cor, z_trans).

 DATEN |> 
  select(E201_02, E201_08) |>
  filter(!is.na(E201_02) & !is.na(E201_08)) |>
  cor()

MC 5.9

Sie haben in R folgende Pipe geschrieben:

DATEN_LT <- Daten |>
  select(E201_02) |> 
  filter(!is.na(E201_02))

Sie bekommen daraufhin die Fehlermeldung: «Error: object ‘Daten’ not found». Was könnte der Fehler sein und wie könnten sie ihn beheben?

Der Datensatz wird anders geschrieben.

Die Daten wurden nicht richtig geladen.

Ich korrigiere die Bezeichnung des Target-Objekts (links vom <-).

Ich ergänze beim filter na.rm = TRUE

MC 5.10

Sie haben in R folgende Pipe geschrieben:

DATEN_LT <- DATEN |>
  select(E201_02) |> 
  summarise(mean = mean(E201_02, na.rm = TRUE)) |>

Sie bekommen daraufhin die Fehlermeldung: «Error: Incomplete expression:». Was könnte der Fehler sein und wie könnten sie ihn beheben?

Der Name des Datensatzes ist unvollständig.

Die Funktion ‘summarise’ ist falsch geschrieben.

Am Ende ist ein Pipe-Operator zu viel.

Ich muss den letzten Pipe-Operator löschen.

MC 5.10

Sie haben in R folgende Pipe geschrieben:

DATEN_LT <- DATEN |>
  select(E201_02) |> 
  summarise(mean = mean(E201_02 na.rm = TRUE))

Sie bekommen daraufhin die Fehlermeldung: «Error: unexpected symbol in: …». Was könnte der Fehler sein und wie könnten sie ihn beheben?

Die Funktion ‘summarise’ muss ‘summarize’ geschrieben werden.

Vor ‘na.rm’ fehlt ein Komma.

Bei select fehlt eine Klammer.

Die Variable E201_02 existiert nicht.

LEF 6

Offene Aufgaben

Beantwortet so kurz wie möglich und nur so ausführlich wie nötig die folgenden offenen Fragen.

Frage 6.1

Von wo bis wo geht Wahrscheinlichkeit? Sagen Sie es in Ihren Worten oder schreiben Sie die Gleichung hin: \(?? \leqq P(A) \leqq ??\)?

Frage 6.2

Wie gross ist die Wahrscheinlichkeit, der Ereignismenge, das also eines aller möglichen Ereignisse eintritt. Tipp: Axiom der Normierung d.h. \(P(\Omega) = 1\).

Frage 6.3

Was ist mit bedingter Wahrscheinlichkeit gemeint? Sagen Sie es in Ihre Worten oder schreiben Sie die Formel für die Berechnung der bedingten Wahrscheinlichkeit hin.

Frage 6.4

Wann heissen zwei Ereignisse «unabhängig»? Sagen Sie es in Ihren Worten oder schreiben Sie die Formel hin.

Frage 6.5

Wie gross ist a) der Mittelwert und b) die Standardabweichung der Standardnormalverteilung?

Frage 6.6

Wie gross ist die gesamte Wahrscheinlichkeitsfläche unter der Standardnormalverteilungskurve?

Frage 6.7

Wenn in der Standardnormalverteilung genau in der Mitte 95% aller Werte liegen, wie viel Prozent der Werte liegen dann an den abgeschnittenen Rändern a) links und b) rechts?

Frage 6.8

Wie lautet «das Gesetz der grossen Zahl»?

Frage 6.9

Was sagt der zentrale Grenzwertsatz?

Geschlossene Aufgaben

  • Kprim (MC)
  • Single-Choice (SC)
  • Text Replacement Task (TRT)

MC 6.1

Sind folgende Aussagen richtig oder falsch?

Kennwerte sind statistische Werte für Stichproben.

Parameter sind statistische Werte für die Grundgesamtheit.

Kennwerte werden anhand von Parametern geschätzt.

Der Stichprobenmmittelwert schätzt den Parameter µ.

MC 6.2

Sind folgende Aussagen richtig oder falsch?

Das Gesetz der grossen Zahl sagt, dass der x̄ stochastisch gegen µ konvergiert.

Der zentrale Grenzwertsatz sagt, dass x̄ bei grossen n normalverteilt ist und zwar mit der Abweichung eines Standardfehlers.

Das Gesetz der grossen Zahl sorgt dafür, dass zufällige Häufungen durch spätere Zufälle in die entgegengesetzte Richtung wieder ausgeglichen werden.

Eine Wahrscheinlichkeit von 2 bedeutet, dass ein Ereignis doppelte Wahrscheinlichkeit hat.

MC 6.3

Sind folgende Aussagen richtig oder falsch?

Der Standardfehler von x̄ wird mit grösserem n immer grösser.

Der Standardfehler von x̄ wird mit grösserem n linear kleiner.

Der Standardfehler von x̄ ist bei n>1 immer kleiner als die Standardabweichung von x.

Der Standardfehler von x̄ wird auch «Spielerfehlschluss» genannt.

SC 6.4

In welcher Farbe ist in der Abbildung die Standardnormalverteilung abgebildet?

SC 6.4

In welcher Farbe ist in der Abbildung die Standardnormalverteilung abgebildet?

dunkelblau

hellblau

gelb

rot

schwarz

TRT 6.5

Was muss eingesetzt werden, damit nur noch gültige Fälle in E201_8 stehen?

DATEN <- DATEN |> 
  filter(______(E201_8))

TRT 6.5

Was muss eingesetzt werden, damit nur noch gültige Fälle in E201_8 stehen?

DATEN <- DATEN |> 
  filter(!is.na(E201_8))

TRT 6.6

Ergänzen Sie die mean-Funktion, um NAs auszuschliessen (auch schön Leerzeichen setzen).

DATEN <- DATEN |> 
  mutate(
    Statistik_Freude = mean(E201_02,_______)
  )

TRT 6.6

Ergänzen Sie die mean-Funktion, um NAs auszuschliessen (auch schön Leerzeichen setzen).

DATEN <- DATEN |> 
  mutate(
    Statistik_Freude = mean(E201_02, na.rm = TRUE)
  )

MC 6.7

Sind folgende Aussagen richtig oder falsch?

Wahrscheinlichkeit ist nie negativ.

Wahrscheinlichkeit geht von 0 bis 1.

Wahrscheinlichkeit hat ein gutes Gedächtnis.

Die Wahrscheinlichkeit für das gemeinsame auftreten zweier unabhängiger Ereignisse ist die Summe ihrer Wahrscheinlichkeiten.

MC 6.8

Sind folgende Aussagen richtig oder falsch?

Die Schiefe einer Verteilung wird mit der Kurtosis beschrieben.

Wenn eine Verteilung linksschief ist, ist sie in der Regel auch rechtssteil.

Kurtosis beschreibt, wie asymmetrisch eine Verteilung ist.

Liegen in einer Verteilung links viele Werte und rechts gibt es einen Long-Tail, dann ist die Skewness positiv.

MC 6.9

Sind folgende Aussagen richtig oder falsch?

In R-Studio enthält die Rproj-Datei die Projekteinstellungen.

Bei Quarto-Dateien kann man sich mit dem Visual-View die Markdown-Formatierungen direkt ansehen.

Es ist sicherer und besser lesbar, wenn man die Pakete mit :: vor die Funktionen schreibt.

«Data Wrangling» bedeutet, dass man auswringt.

LEF 7

Offene Aufgaben

Beantwortet so kurz wie möglich und nur so ausführlich wie nötig die folgenden offenen Fragen.

Frage 7.1

Was bezeichnet der «Erwartungswert»? Vervollständigen Sie den Satz:

«Der Erwartungswert ist der Durchschnitt eines …, wenn man die Ziehung … sehr oft durchführt.»

Frage 7.2

Der Mittelwert \(\overline{X}\) ist erwartungstreu, wenn der … des Mittelwerts … entspricht.

Frage 7.3

Die Erwartungswerte für \(X\) und \(\overline{X}\) sind identisch und zwar: …

Frage 7.4

Schreiben Sie die korrekte Formel für die erwartungstreue Schätzung der Varianz \(\sigma^2\) auf.

Frage 7.5

Was ist der Unterschied zwischen Punkt- und Intervallschätzung?

Frage 7.6

Schreiben Sie jeweils auf, ob das KI eines Mittelwerts einer Variablen «breiter» oder «schmaler» wird oder «gleich» bleibt, wenn nur

  1. die Fallzahl n erhöht wird,
  2. das Signifikanzniveau runtergesetzt wird (z.B. von 95% auf 80%),
  3. die Standardabweichung der Variable grösser ist,
  4. der Mittelwert der Variable grösser ist
  5. eine grössere Irrtumswahrscheinlichkeit erlaubt wird.

Frage 7.7

Angenommen, wir haben ein Seminar mit \(n = 25\) Teilnehmenden. In der Evalutaion (Vollerhebung) ergibt sich ein Zufriedenheitsindex mit einem Mittelwert von \(\overline{X} = 3\) und Standardabweichung von \(\sigma = 5\). Wie gross ist dann das 95%-Konfidenzintervall?

Geben Sie die obere und untere Grenze des Konfidenzintervalls an.

Frage 7.8

Angenommen, wir haben eine Stichprobe mit \(n = 16\) Befragten. Der Mittelwert eines KI-Sorgen-Index liegt bei \(\overline{X} = 2\) und einer Standardabweichung von \(s=8\).

  1. Geben Sie das Konfidenzintervall an, wobei noch gegeben sei, dass \(t_{\alpha/2,15} \approx 2.131\) ist.
  2. Wie würde das Ergebnis lauten, wenn die Fallzahl \(n = 400\) wäre?

Frage 7.10

Angenommen, wir haben \(n = 100\) Personen gefragt, ob sie an einer Abstimmung zur Enteignung von KI-Giganten teilnehmen würden. 80% der Befragten haben gesagt, dass sie teilnehmen würden.

In welchem Konfidenzintervall liegt die tatsächliche Bereitschaft (wenn wir mal davon ausgehen, dass die Leute ehrlich und realistisch waren)?

Geschlossene Aufgaben

  • Kprim (MC)
  • Single-Choice (SC)
  • Text Replacement Task (TRT)

MC 7.1

Sind folgende Aussagen richtig oder falsch?

Der Erwartungswert ist in der Regel 95%.

Ein erwartungstreuer Schätzer ist ein Schätzer, dessen Erwartungswert dem wahren Parameterwert entspricht.

Der Erwartungswert einer Variable X sowie seines Mittelwerts sind µ.

Der Mittelwert ist ein erwartungstreuer Schätzer von µ.

MC 7.2

Sind folgende Aussagen richtig oder falsch?

Die Varianz von Stichproben unterschätzt die Varianz in der Grundgesamtheit um den Faktor n/(n-1).

Je grösser die Stichprobe n, desto stärker unterschätzt die nicht korrigierte Standardabweichung (Stichprobenversion), die Standardabweichung in der GG.

Die Standardabweichung einer Variablen für die Stichprobe ist immer grösser als die geschätzte für die Grundgesamtheit.

Die geschätzte Standardabweichung für die Grundgesamtheit ist das Quadrat der Standardabweichung der Stichprobe.

MC 7.3

Sind folgende Aussagen richtig oder falsch?

Das Konfidenzintervall von x̄ wird mit grösserem n immer grösser.

Das Konfidenzintervall von x̄ wird mit grösserem n linear kleiner.

Das Konfidenzintervall von x̄ schliesst immer 0 ein.

Das Konfidenzintervall von x̄ wird bei höherem Sicherheitsniveau breiter.

SC 7.4

Für welchen der folgenden Kennwerte einer Stichprobe kann man kein Konfidenzintervall ausrechnen?

n

Mittelwert

Median

Standardabweichung

Prozentwert

TRT 7.5

Aus der Variablen E201_02 soll eine Dummyvariable berechnet werden, die eine 1 hat bei 5 «trifft voll zu» und eine 0 für die anderen Werte. Was muss bei der if_else()-Funktion ergänzt werden, damit die Dummy korrekt berechnet wird?

DATEN <- DATEN |> 
  mutate(E201_02_D = if_else(E201_02_____5, 1, 0).

TRT 7.5

Aus der Variablen E201_02 soll eine Dummyvariable berechnet werden, die eine 1 hat bei 5 «trifft voll zu» und eine 0 für die anderen Werte. Was muss bei der if_else()-Funktion ergänzt werden, damit die Dummy korrekt berechnet wird?

DATEN <- DATEN |> 
  mutate(E201_02_D = if_else(E201_02 == 5, 1, 0).

TRT 7.6

Was muss ergänzt werden, damit für die verschiedenen Studienprogramme (Major/Minor/MA; die in der Gruppenvariable in A201 stehen) jeweils die Mittelwerte berechnet werden?

DATEN <- DATEN |> 
  _____(A201 |> )
  summarise(Mittel = mean(E201_02, na.rm = TRUE)).

TRT 7.6

Was muss ergänzt werden, damit für die verschiedenen Studienprogramme (Major/Minor/MA; die in der Gruppenvariable in A201 stehen) jeweils die Mittelwerte berechnet werden?

DATEN <- DATEN |> 
  group_by(A201 |> )
  summarise(Mittel = mean(E201_02, na.rm = TRUE)).

MC 7.7

Sind folgende Aussagen richtig oder falsch?

Ein Konfidenzintervall wird breiter, wenn der Stichprobenumfang n kleiner wird.

Ein Konfidenzintervall wird breiter, wenn ein kleineres Sicherheitsniveau gewählt wird (z.B. 95% auf 90%).

Der Erwartungswert einer Stichprobe ist immer identisch mit dem Erwartungswert der Grundgesamtheit.

Eine Punktschätzung ist immer präziser als eine Intervallschätzung.

MC 7.8

Sind folgende Aussagen richtig oder falsch?

Ein Konfidenzintervall von 95% deckt in 95% der Fälle den wahren Parameterwert ab.

Der t-Wert wird bei kleinen Stichproben statt des z-Werts verwendet.

Schon ab etwa n = 100 geht die t-Verteilung hinreichend in eine z-Verteilung über.

Je kleiner der Standardfehler, desto genauer ist die Schätzung des Mittelwerts.

MC 7.9

Sind folgende Aussagen richtig oder falsch?

In R kann man mit dem Paket sjlabelled:: Variablenlabel vergeben, aber keine Wertelabel.

Die Autovervollständigung des Codes in R-Studio berücksichtigt Datensätze, Variablen, Funktionen und Pakete.

Wenn man am Anfang seiner qmd-Datei nur das tidyverse lädt, muss man für das Paket sjmisc:: eigentlich nicht vor die Funktion frq() schreiben, aber dplyr:: vor mutate().

Paket-Vignetten sind Dokumentationen über R-Pakete mit Funktionsbeschreibungen und Beispielanwendungen.

LEF 8

Offene Aufgaben

Beantwortet so kurz wie möglich und nur so ausführlich wie nötig die folgenden offenen Fragen.

Frage 8.1

Was versteht man unter einer Nullhypothese und einer Alternativhypothese? Erklären Sie den Unterschied mit einem Beispiel.

Frage 8.2

Was bedeutet ein Signifikanzniveau von 5%? Was wird dadurch festgelegt?

Frage 8.3

Welche Annahmen werden beim t-Test getroffen? Nennen Sie mindestens drei.

Frage 8.4

Was ist der Unterschied zwischen einem Fehler erster Art (Alpha-Fehler) und einem Fehler zweiter Art (Beta-Fehler)?

Frage 8.5

Wie hängen die beiden Fehlerarten zusammen?

Frage 8.6

Eine fröhliche Dozentin möchte überprüfen, ob eine neue Lernmethode zu besseren Ergebnissen führt als die herkömmliche Methode. Sie führt einen t-Test mit n = 20 Teilnehmenden durch und erhält einen p-Wert von .03. Was sagt ihr dieser p-Wert aus? Was wäre, wenn der p-Wert .08 wäre?

Frage 8.7

Erklären Sie, wie man anhand eines p-Werts entscheidet, ob ein Ergebnis statistisch signifikant ist oder nicht. Was bedeutet «statistisch signifikant» in diesem Zusammenhang?

Frage 8.8

Warum kann man nicht sagen, dass eine wissenschaftliche Hypothese widerlegt ist, wenn die H0 beibehalten werden muss, die doch der H1 widerspricht?

Frage 8.9

Was ist gemeint, wenn es heisst eine gerichtete wissenschaftliche Hypothese kann durch eine mögliche Ausprägung der H1 widerlegt und durch die andere bestätigt werden, wenn die eine zugehörige H0 zurückgewiesen werden kann?

Frage 8.10

Was ist gemeint, wenn es heisst, dass bei sehr grossen Fallzahlen fast immer die H0 zurückgewiesen wird und die Annahme einer H1 noch kein relevanter Effekt ist?

Geschlossene Aufgaben

  • Kprim (MC)
  • Single-Choice (SC)
  • Text Replacement Task (TRT)

MC 8.1

Sind folgende Aussagen richtig oder falsch?

Ein p-Wert von 0.01 bedeutet, dass die Nullhypothese zu 1% wahr ist.

Wenn der p-Wert kleiner ist als das Signifikanzniveau, wird die Nullhypothese verworfen.

Ein Fehler erster Art tritt auf, wenn man die Nullhypothese ablehnt, obwohl sie wahr ist.

Der t-Test eignet sich nur für Stichproben mit mehr als 30 Beobachtungen.

MC 8.2

Sind folgende Aussagen richtig oder falsch?

Ein Fehler erster Art ist grundsätzlich weniger problematisch als ein Fehler zweiter Art.

Ein hoher p-Wert bedeutet, dass die Nullhypothese bewiesen wurde.

Der t-Test wird verwendet, um Mittelwertunterschiede zu testen.

Ein Fehler zweiter Art tritt auf, wenn die Alternativhypothese fälschlicherweise angenommen wird.

MC 8.3

Sind folgende Aussagen richtig oder falsch?

Wenn der p-Wert eines Tests 0.04 beträgt und das Signifikanzniveau 0.05 ist, ist das Ergebnis signifikant.

Ein zweiseitiger Test ist empfindlicher gegenüber Abweichungen als ein einseitiger Test.

Die Wahrscheinlichkeit, einen Fehler erster Art zu begehen, wird durch das Signifikanzniveau festgelegt.

Der t-Test setzt immer Normalverteilung der Daten voraus.

MC 8.4

Sind folgende Aussagen richtig oder falsch?

Wenn das Konfidenzintervall (KI) eines Mittelwertes die 0 einschliesst, ist es signifikant von 0 verschieden.

Wenn das KI eines Mittelwertes die 0 nicht einschliesst, ist der Mittelwert signifikant von 0 verschieden.

Wenn ein Mittelwert auf dem 1% Signifikanzniveau signifikant von 0 verschieden ist, dann kann auch im 95%-KI die 0 nicht enthalten sein.

Wenn ein Mittelwert auf dem 5% Signifikanzniveau signifikant von 0 verschieden ist, dann kann auch im 99%-KI die 0 nicht enthalten sein.

MC 8.5

Sind folgende Aussagen richtig oder falsch?

Nur wenn die H0 abgelehnt und eine H1 angenommen wird, kann über die wissenschaftliche Hypothese entschieden werden.

Wird die H0 beibehalten, gibt es keine statistische Entscheidungsmöglichkeit über die wissenschaftliche Hypothese.

Wird die H0 angenommen, ist die wissenschaftliche Hypothese falsifiziert.

Die H1 ist immer die aus der Theorie abgeleitete Hypothese.

SC 8.6

Welche der folgenden Hypothesen lässt sich nicht statistisch überprüfen?

Je mehr ein Thema in den Medien thematisiert wird, desto wichtiger finden es die Rezipient:innen.

Wer liesst, weiss mehr.

Gewaltinhalte können zu mehr oder weniger Gewalttaten führen oder das Niveau ist gleichbleibend.

Die Sorge vor der Entwicklung von KI in der Zukunft sinkt mit dem Alter der Befragten.

Je mehr jemand an Gott glaubt, desto weniger Nachrichten werden konsumiert.

TRT 8.7

Vervollständigen Sie:

Wenn die ________ beibehalten werden muss, kann statistisch kein Effekt
nachgewiesen, aber keiner ausgeschlossen werden.

TRT 8.7

Vervollständigen Sie:

Wenn die H0 beibehalten werden muss, kann statistisch kein Effekt
nachgewiesen, aber keiner ausgeschlossen werden.

TRT 8.8

Pakete und Funktionen: Wenn Sie die Funktion frq() aus dem Paket sjmisc für die Variable E201_02 anwenden wollen und nicht geladen haben, was müssen Sie in der Lücke einsetzen?

DATEN |> _________

TRT 8.8

Pakete und Funktionen: Wenn Sie die Funktion frq() aus dem Paket sjmisc für die Variable E201_02 anwenden wollen und nicht geladen haben, was müssen Sie in der Lücke einsetzen?

DATEN |> 
  sjmisc::frq(E201_02)

LEF 9

Offene Aufgaben

Beantwortet so kurz wie möglich und nur so ausführlich wie nötig die folgenden offenen Fragen.

Frage 9.1

Was versteht man unter einer Nullhypothese und einer Alternativhypothese? Erklären Sie den Unterschied mit einem Beispiel.

Frage 9.1

Was versteht man unter einer gerichteten Hypothese und einer ungerichteten Hypothese?

Frage 9.2

Warum kann eine ungerichtete Hypothese mit einer Stichprobe nicht widerlegt werden, aber eine gerichtete schon?

Frage 9.3

Warum ist eine spezifische Hypothese noch gehaltvoller und besser zu widerlegen als eine bloss gerichtete Hypothese?

Frage 9.4

Schreiben Sie zu jeder der folgenden Hypothesen auf, welcher gerichtete Effekt ihr widersprechen würde. Also, ob ein negativer oder positiver Mittelwertunterschied (immmer 1. Gruppe gegen 2. Gruppe) oder ein negativer beziehungsweise positiver Zusammenhang.

1. Leser:innen wissen mehr.

2. Je stärker ein Thema in den Medien thematisiert wird, desto wichtiger finden die Menschen das Thema.

3. Menschen denken, dass andere Personen mehr von Medienwirkungen beeinflusst werden, als sie selbst.

4. Je mehr Nachrichtenfaktoren auf eine Meldung zutreffen, desto weiter oben (Rangplatz in den Nachrichten), ist eine Meldung platziert (1 = 1. Platz, 2 = 2. Platz usw.)

5. Je gebildeter Menschen sind, desto weniger schauen sie Fernsehen.

6. Vielseher:innen halten die Welt für gefährlicher als Wenigseher:innen (TV).

7. Mediennutzer:innen entnehmen den Medien soziale Normen.

8. Menschen wenden sich den Medien zu, von denen Sie den höchsten Nutzen erwarten.

9. Meinungsführer:innen beeinflussen die Meinungen ihres Umfeldes mehr als die Medien.

10. Menschen neigen dazu, ihre Meinung zu verschweigen, wenn sie glauben, sie seien in der Minderheit.

Frage 9.5

Formulieren Sie jeweils eine wissenschaftliche Hypothese zu einer kommunikationswissenschaftlichen Theorie, eine H+1 und eine H-1 zu einem…

  1. Gruppenunterschied und…
  2. zu einem Zusammenhang.
  3. Wie wäre jeweils die H0 formuliert und was würde die Beibehaltung der H0 bedeuten?

Frage 9.6

Schweigespirale: t-Test mit unabhängigen Stichproben

In einer Umfrage zur Meinungsäusserung in der Klimapolitik wurden zwei Gruppen verglichen:

  • Gruppe A: Personen, die glauben, ihre Meinung zur aktuellen Klimapolitik entspreche der öffentlichen Mehrheitsmeinung
  • Gruppe B: Personen, die glauben, ihre Meinung widerspreche der öffentlichen Mehrheitsmeinung

Beide Gruppen bewerteten auf einer Skala von 1 (sehr unwahrscheinlich) bis 7 (sehr wahrscheinlich), wie wahrscheinlich sie es finden, ihre Meinung öffentlich zu äussern.

Frage 9.6 (cont.)

Schweigespirale: t-Test mit unabhängigen Stichproben

Die Ergebnisse:

Gruppe Mittelwert Standardabweichung n
Meinung = Mehrheitsmeinung (A) 5.0 1.0 20
Meinung ≠ Mehrheitsmeinung (B) 4.0 1.0 20

(Der kritische t-Wert für einen zweiseitigen Test mit df = 24 ist 2,02.)

a) Formulieren Sie die Hypothesen H+1, H-1 und H0 für einen t-Test mit unabhängigen Stichproben.

b) Führen Sie den t-Test auf dem Niveau von 5% durch.

c) Was bedeutet das Ergebnis für die Schweigespiraltheorie?

Geschlossene Aufgaben

  • Kprim (MC)
  • Single-Choice (SC)
  • Text Replacement Task (TRT)

MC 9.1

Sind folgende Aussagen richtig oder falsch?

Ein positiver t-Wert bei einem t-Test für unabhängige Stichproben heisst immer, dass die \(H_+1\) gilt.

Wenn die H-1 signifikant bestätigt werden kann, ist die theoretische Hypothese eines negativen Unterschied empirisch geschwächt.

Wenn die H0 beibehalten wird, ist eine gerichtete Hypothese widerlegt.

Wird ein starker Mittelwertunterschied zwischen zwei Gruppen angenommen (zB 1 bei einer 5er-Skala mit ±.1 Fehlerbereich), sagt die H0, dass der Unterschied 1 sein könnte und das KI des Mittelwertunterschieds den Fehlerbereich einschliesst.

MC 9.2

Sind folgende Aussagen richtig oder falsch?

Wenn eine ANOVA einen signifikanten F-Wert hat, hat mind. eine Gruppe einen höheren Mittelwert als die anderen.

Wenn eine ANOVA einen signifikanten F-Wert hat, unterscheiden sich alle Gruppen signifikant voneinander.

Wenn der p-Wert des F-Testes einer ANOVA grösser ist als .05, dann unterscheiden sich die Gruppen nicht signifikant voneinander.*

Eine ANOVA kann mit zwei oder mehr Gruppen als UV durchgeführt werden.

HINWEIS: Wenn nichts weiter gesagt wird, bezieht sich Signifikanz immer auf das 5%-Signifikanzniveau!

MC 9.3

Sind folgende Aussagen richtig oder falsch?

In einer Kreuztabelle stehen die Ausprägungen der UV in der Regel über den Spalten.

In der Regel wird in Kreuztabellen spaltenweise prozentuiert.

Die «Randverteilung» einer Kreuztabelle besteht aus den einfachen Häufigkeitsauszählungen der Variablen.

Aus einer Kreuztabelle könnte man zwei Variablen und ihre Wertekombinationen «wiederherstellen».

MC 9.4

Sind folgende Aussagen richtig oder falsch?

Der Chi²-Test ist ein Anpassungstest.

Wenn der p-Wert eines Chi²-Tests signifikant ist, unterscheiden sich alle Gruppen voneinander.

Wenn der p-Wert eines Chi²-Tests signifikant ist, ist die UV von der AV abhängig.

Wenn der p-Wert eines Chi²-Tests signifikant ist, lohnt die Aufteilung nach den Gruppen der UV.

MC 9.5

Sind folgende Aussagen richtig oder falsch?

Der Chi²-Tests setzt u.a. voraus, dass die UV und die AV kategorial (oder ordinal) sind.

Die erwartete Häufigkeiten sollten in keiner Zelle unter 5 liegen.

Wenn die H0 des Chi²-Tests zurückgewiesen wurde, muss noch geklärt werden, ob die Gruppenunterschiede die wissenschaftliche Hypothese bestätigen oder ihr widersprechen.

Der Chi²-Test zählt zu den nonparametrischen Tests.

SC 9.6

Welchen Test würden Sie verwenden, um einen Mittelwertunterschied zwischen zwei Gruppen statistisch zu überprüfen?

t-Test für abhängige Stichproben

t-Test für Korrelationen

F-Test der ANOVA

t-Test für unabhängige Stichproben

Chi²-Test

TRT 9.7 t-Test für unabhängige Stichproben

Wenn Sie mit tidycomm::t_test einen t-Test für unabhängige Stichproben durchführen wollen und die UV NUTZ (Mediennutzung vs Nichtnutzung) und die AV ANGST heisst, wie müssten Sie die beiden Variablen in die Lücke eintragen? Beachten Sie auch guten Stil!

DATEN |> 
  tidycomm::t_test(_________)

TRT 9.7 t-Test für unabhängige Stichproben

Wenn Sie mit tidycomm::t_test einen t-Test für unabhängige Stichproben durchführen wollen und die UV NUTZ (Mediennutzung vs Nichtnutzung) und die AV ANGST heisst, wie müssten Sie die beiden Variablen in die Lücke eintragen? Beachten Sie auch guten Stil!

DATEN |> 
  tidycomm::t_test(NUTZ, ANGST)

TRT 9.8 Pakete und Funktionen

Wenn Sie die Funktion t_test() aus dem Paket tidycomm für die AV SPRSS und die UV MOTIV anwenden wollen und nicht geladen haben, was müssen Sie in der Lücke einsetzen?

DATEN |> 
  _____________

TRT 9.8 Pakete und Funktionen

Wenn Sie die Funktion t_test() aus dem Paket tidycomm für die AV SPRSS und die UV MOTIV anwenden wollen und nicht geladen haben, was müssen Sie in der Lücke einsetzen?

DATEN |> 
  tidycomm::t_test(MOTIV, SPRSS)

LEF 10

Offene Aufgaben

Beantwortet so kurz wie möglich und nur so ausführlich wie nötig die folgenden offenen Fragen.

Frage 10.1

a) Erklären Sie, warum eine signifikante Korrelation zwischen zwei Variablen nicht notwendigerweise auf einen kausalen Zusammenhang hinweist. b) Bringen Sie ein Beispiel.

Frage 10.2

a) Erklären Sie, warum es sein kann, dass es einen Zusammenhang zwischen zwei Variablen gibt und die Korrelation trotzdem 0 ist. b) Bringen Sie ein Beispiel.

Frage 10.3

a) Erklären Sie das Simpsons-Paradox. b) Bringen Sie ein Beispiel.

Frage 10.4

Unter welchen Bedingungen ist die Kovarianz zweier Variablen gleich der Korrelation der beiden Variablen? Was haben standardisierte Koeffizienten mit standardisierten Variablen zu tun?

Frage 10.5

Inwiefern spielt die Grösse eines Korrelationskoeffizienten eine Rolle. Was hat die Grösse von r mit spezifischen Hypothesen zu tun?

Frage 10.6

Wie würden Sie das Konfidenzintervall einer Korrelation interpretieren?

Frage 10.7

Zeigen Sie an einem Beispiel, dass es sein kann, dass man einen positiven Zusammenhang findet, der sich aber in einer negativen Korrelation zeigt, wenn die Kodierung einer Variable niedrig ist, wenn eigentlich die das Merkmal hoch oder stark ist. Erklären Sie das am Beispiel von Single-Chartplatzierungen und Verkaufszahlen.

Frage 10.8

Was ist das Ziel von Statistik? Formulieren Sie in ein, zwei Sätze, in denen das Ziel zusammengefasst ist. Tip: Was immer am Anfang der Vorlesung gesagt wird.

Geschlossene Aufgaben

  • Kprim (MC)
  • Single-Choice (SC)
  • Text Replacement Task (TRT)

MC 10.1

Sind folgende Aussagen richtig oder falsch?

Korrelationen sind immer positiv.

Kovarianzen mit z-transformierten Variablen sind identisch mit deren Korrelation.

Kovarianzen können von 1/∞ bis ∞ gehen.

Die Kovarianz zweier Variablen ist immer identisch mit dem Produkt ihrer Varianzen.

MC 10.2

Sind folgende Aussagen richtig oder falsch?

Wenn die Beziehung zwischen zwei Variablen kurvilinear ist, kann r 0 sein.

Eine Korrelation bedeutet nicht immer, dass auch ein kausaler Zusammenhang besteht.

Ist eine Korrelation nicht signifikant, muss die H0 beibehalten werden.

Ist eine positive Korrelation nicht signifikant, kann der Zusammenhang in der GG mit 95% Sicherheit genauso gross sein wie in der Stichprobe, doppelt so gross, 0 oder in der GG negativ sein.

MC 10.3

Sind folgende Aussagen richtig oder falsch?

Wenn in einer wissenschaftlichen Hypothese ein negativer Zusammenhang postuliert wird, ist sie bestätigt, wenn die H+1 stimmt, also die Korrelation negativ signifikant ist.

Wenn in einer wissenschaftlichen Hypothese ein negativer Zusammenhang postuliert wird, ist sie bestätigt, wenn die H-1 stimmt.

Es kann sein, dass man einen positiven Zusammenhang findet, der sich aber in einer negativen Korrelation zeigt, wenn die Kodierung einer Variable niedrig ist, wenn eigentlich die das Merkmal hoch oder stark ist.

Wenn man aus bisheriger Forschung einen Korrelationskoeffizienten zur gleichen Hypothese findet, kann man gut gegen den testen.

MC 10.4

Sind folgende Aussagen richtig oder falsch?

Zeitreihen bestehen aus aggregierten Werten über die Zeit.

Zusammenhänge in Zeitreihen können mit einfachen Korrelationen gut abgebildet werden.

Bei Zeitreihenanalysen gibt es auch univariate Korrelationen.

Bei Zeitreihen spielt die Sortierung der Datenzeilen keine Rolle.

MC 10.5

Sind folgende Aussagen richtig oder falsch?

Die Korrelation einer Variablen mit sich selbst ist immer 1.

Die Korrelation einer Variablen mit sich selbst ist immer 0

Auch für Korrelationskoeffizienten r kann man ein KI berechnen.

Wenn das KI von r die 0 einschliesst, ist r nicht signifikant von 0 verschieden.

SC 10.1

Mit welchem der folgenden Tests werden Korrelationen auf Signifikanz getestet?

\(X^2\)-Test

F-Test

z-Test

t-Test

Wilkoxon-Test

TRT Aufgaben auf OLAT

Prüfungssimulation mit «Rechnerin»

Wechseln Sie in unseren OLAT-Kurs und gehen dort auf «Testaufgaben Rechnerin», starten Sie den Test und lösen Sie die Aufgaben mit der Rechnerin (dort auch nochmal verlinkt).

LEF 11

Offene Aufgaben

Beantwortet so kurz wie möglich und nur so ausführlich wie nötig die folgenden offenen Fragen.

Frage 11.1

Was ist der Vorteil, wenn man sich das Konfidenzintervall eines Korrelationskoeffizienten anschaut, statt \(r\) nur gegen die Nullhypothese \(H_0\) zu testen?

Frage 11.2

Welchen Kennwert für Korrelation bei

  1. ordinalen Variablen und
  2. dichotomen Variablen

kennen Sie?

Frage 11.3

Wenn Spearman’s \(\rho\) allgemeiner angewendet werden kann als Pearson’s \(r\), warum nimmt man dann nicht immer einfach Spearman?

Frage 11.4

a) Erklären Sie kurz das Prinzip von Bootstrapping.

b) Was bringt Bootstrapping für Vorteile?

Frage 11.5

Was ist das Ziel der Poweranalyse?

Frage 11.6

Was ist das Problem, wenn eine Stichprobe für die Power eines Testes zu klein ist?

Frage 11.7

Was sind in R Typumwandlungen und wozu braucht man das?

Geschlossene Aufgaben

  • Kprim (MC)
  • Single-Choice (SC)
  • Text Replacement Task (TRT)

MC 11.1

Sind folgende Aussagen richtig oder falsch?

Auch für Korrelationskoeffizienten kann man Konfidenzintervalle berechnen.

Das Konfidenzintervall von r ist immer grösser als die Summe der Standardabweichungen.

Schliesst das KI von r die 0 ein, ist r nicht signifikant von 0 verschieden.

Überschneiden sich die KIs von zwei Korrelationskoeffizienten nicht, sind sie signifikant voneinander unterschieden.

MC 11.2

Sind folgende Aussagen richtig oder falsch?

Bei kategorialen Variablen kann man Spearman’s 𝜌 berechnen.

Bei dichotomen Dummy-Variablen kann man Pearsons r berechnen.

Der Phi-Koeffizient für dichotome Variablen ist dasselbe wie r.

Die Punkt-Biseriale Korrelation ist dasselbe wie r.

MC 11.3

Sind folgende Aussagen richtig oder falsch?

Beim Bootstrapping werden aus einer bestehenden Stichprobe sehr viele Stichproben mit demselben Umfang gezogen.

Beim Bootstrapping werden für jede der Zufallsstichproben die KIs berechnet.

Mit Bootstrapping kann man die KIs von Kennwerten bestimmen, ohne dass Vorraussetzungen wie die Normalverteilung erfüllt sein müssen.

Bootstrapping kann man nicht in R nutzen.

SC 11.4

Was versucht man mit Hilfe von Poweranalysen zu bestimmen?

die Effektstärke

die Power

den Stichprobenumfang n

das Signifikanznviveau

den β-Fehler

MC 11.5

Sind folgende Aussagen richtig oder falsch?

Kennwerte haben unterschiedliche Power.

Power ist eine Eigenschaft von Stichproben.

Poweranalysen werden herangezogen, um Mindeststichprobengrössen zu bestimmen.

Die Effektstärke ist die Grösse, die eine Ursache annehmen kann.

MC 11.6

Sind folgende Aussagen richtig oder falsch?

In R sind «tibbles» besondere «data frames» die im tidyverse verwendet werden.

Jeder «data frame» ist auch ein «tibble»

Wenn man in R eine ANOVA berechnen möchte, muss man vorher die UV in eine character- oder factor-Variable umwandeln.

Typumwandlung ist die Umwandlung eines «data frames» in ein «tibble».

MC 11.7

Sind folgende Aussagen richtig oder falsch?

Importiert man Daten (zB aus Excel) bestimmt R die Variablen-Typen automatisch.

Wenn man in einer Spalte mit viel Text (in einer Exceldatei) eine reine Zahl hat, wird beim Import der Typ als «numeric» festgelegt.

Wenn man in einer Zahlenspalte (in einer Exceldatei) einen Buchstaben hat, wird beim Import der Typ als «character» festgelegt.

«factors» in R sind kategoriale Variablen, deren Level und Label man festlegen kann.

TRT Aufgaben auf OLAT

Prüfungssimulation mit «Rechnerin»

Lösen Sie die Aufgaben R 11 auf der für die Klausur vorbereiteten Seite der Rechnerin.

LEF 12

Offene Aufgaben

Beantwortet so kurz wie möglich und nur so ausführlich wie nötig die folgenden offenen Fragen.

Frage 12.1

Wie ist die Korrelation definiert?

  1. ganze Formel
  2. Formel mit cov(x,y)
  3. beschrieben

Frage 12.2

Was ist das Analyseziel einer Regression?

Frage 12.3

Wie sind die Regressionskoeffizienten gekennzeichnet (welcher Buchstabe)?

Frage 12.4

Was ist der Unterschied zwischen BETA und \(\beta\)?

Frage 12.5

Was drückt der Standardfehler der Regressionskoeffizienten b aus?

Frage 12.6

Mit welchen Kennwerten kann die Modellgüte insgesamt bewertet werden?

Frage 12.7

Was ist a) \(R^2_{adj.}\) und b) wann würde man es verwenden?

Frage 12.8

Was sagt die Signifikanz des F-Tests für ein Regressionsmodell aus?

Geschlossene Aufgaben

  • Kprim (MC)
  • Single-Choice (SC)
  • Text Replacement Task (TRT)

MC 12.1

Sind folgende Aussagen richtig oder falsch?

Die Regressionskoeffizienten (b’s) sind unstandardisiert.

Die standardisierten Regressionskoeffizienten messen die unbekannten Parameter β.

Die standardisierten Regressionskoeffizienten sind wie Korrelationen interpretierbar.

Die Standardfehler der b’s sind immer 1.

MC 12.2

Sind folgende Aussagen richtig oder falsch?

Das Bestimmtheitsmass R² gibt an, welcher Varianzanteil der AV durch die UV bzw. die UVs erklärt werden kann.

R²_adj. wird nur bei sehr grossen Stichproben gebraucht, um zufällige Signifikanzen zu vermeiden.

Der F-Test zum R² testet, ob alle UVs signifikant sind.

Wenn R² kleiner als .05 ist, dann ist die Regression signifikant.

MC 12.3

Sind folgende Aussagen richtig oder falsch?

Die standardisierten Regressionskoeffizienten entsprechen bei der bivariaten Regression der Korrelation.

Die Regressionskoeffizienten b liegen immer zwischen -1 und 1.

Das Bestimmtheitsmass R² gibt den Prozentanstieg der Regressionsgeraden an.

Die Konstante in der Regressionsgleichung wird bei Regressionsmodellen als b1 gekennzeichnet (auch als b0).

SC 12.4

Mit welchem der folgenden Kennwerte können Sie die Effektstärke von Regressionskoeffizienten am besten über verschiedene Erhebungen hinweg vergleichen?

𝛃

b

BETA

F

MC 12.5

Sind folgende Aussagen richtig oder falsch?

Positron ist eine Programmiersprache für statistische Analysen.

Positron ist die modernere Alternative zu R-Studio für R, Python, Quarto und vieles mehr.

Python ist eine allgemeinere Programmiersprache als R und wird im Bereich des Data Science vielfältig angewendet.

Man kann in R leider keine Funktionen bauen.

MC 12.6

Sind folgende Aussagen richtig oder falsch?

Regressionsmodelle bilden Komplexität ab und sind sequentiell leicht zu lesen.

Für die standardisierten Regressionskoeffizienten können auch Konfidenzintervalle angegeben werden.

Die Modellgüte kann auch als Übereinstimmung von Prognosen an Testdaten festgestellt werden.

Regressionen sind eine Form der GLM.

MC 12.7

Sind folgende Aussagen richtig oder falsch?

Bei der bivariaten Regression ist die Wurzel aus R² gleich Pearsons r.

Wenn es in einer Regression zwei UVs gibt, spricht man schon von «multivariat».

Wenn ein b signifikant ist, wird auch R² des Gesamtmodells signifikant.

R² gibt an, wie viel Prozent der Varianz der AV durch alle UVs zusammen erklärt werden können.

TRT Aufgaben auf OLAT

Prüfungssimulation mit «Rechnerin»

Lösen Sie die Aufgaben R 12 auf der für die Klausur vorbereiteten Seite der Rechnerin.